RI structurée, RI et XML, RI précise

نویسندگان

  • Ali Aïtelhadj
  • Mohamed Mezghiche
  • Fatiha Souam
چکیده

In this paper we present a clustering method for XML documents. Our step is twophase based: we first automatically extract the structure from the document; we then use it as model of representation to classify the document that it represents. The matching of the documents’ structures is based on the calculation of their similarities. For the experimentation we used the INEX. MOTS-CLÉS: Clustering, classification structurelle, structure, arbre, similarité, contexte, nœud, index, seuil.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Interprétation vague des contraintes structurelles pour la RI dans des corpus de documents XML - Évaluation d'une méthode approchée de RI structurée

RÉSUMÉ. Nous proposons des algorithmes dédiés à l’indexation et à la recherche approximative d’information dans les bases de données hétérogènes semi-structurées XML. Le modèle d’indexation proposé est adapté à la recherche de contenu textuel dans les contextes XML définis par les structures d’arbres. Les mécanismes de recherche approchée mis en œuvre s’appuient sur une distance de Levenshtein ...

متن کامل

Réinjection de structures pour la reformulation de requêtes en RI structurée

Relevance Feedback (RF) is a technique allowing to enrich an initial query according to the user feedback. The goal is to express more precisily the user’s needs. Some open issues appear when considering semi-structured documents like XML documents. Most of the existing RF approaches are applied in the content of elements. We propose a new approach that is able to extend the initial query by ad...

متن کامل

Texte et Représentation en Recherche d'Information

Les performances des modèles de Recherche d'Information (RI) sont for-tement liées à leur capacité à représenter le texte. Ces dernières années, portés par les succès en reconnaissance d'image et de parole, de nombreux modèles basés sur les réseaux de neurones et les représentations distri-buées des mots et phrases sont apparus. Quelques modèles ont essayé d'aborder le problème de la RI, dont u...

متن کامل

Propositions pour la pondération des termes et l'évaluation de la pertinence des éléments en recherche d'information structurée

Structured Information Retrieval copes with a number of open issues. One can cite the evaluation of elements relevance: the aim is to return to the user a ranked list of results. This evaluation is based on the term weighting scheme and on the model used for the matching of queries and elements. In this paper, we propose to explore some clues to answer to this problem. For example, we propose t...

متن کامل

Relationship between Intra-renal Arterial Resistance Index (RI) and Albuminuria in Diabetic Patients

OBJECTIVE: Diabetic nephropathy is a major diabetes complication. Arterial resistance index (RI) may predict deterioration in kidney function. This study was designed to compare renal arterial RI in different stages of renal function according to glomerular filtration rate (GFR), serum creatinine level and proteinuria. MATERIALS AND METHODS: In a cross-sectional study on 81 diabetic patients i...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2009